package source;

import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

/**
 * Author itcast
 * Date 2021/6/16 9:43
 * Linux
 * tar -zcvf hello.tar.gz hello.txt
 * 需求: 从文件(txt 文件 , tar.gz 文件)中读取数据并打印输出
 * 步骤:
 * 1. 创建流执行环境
 * 2. 设置并行度
 * 3. 读取文件的路径
 * 4. 打印输出
 * 5. 执行流环境
 */
public class FlinkFileSource {
    public static void main(String[] args) throws Exception {
        //1. 创建流执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        //2. 设置并行度
        env.setParallelism(1);
        //3. 读取文件的路径
        //DataStreamSource<String> source = env.readTextFile("data/hello.txt");
        DataStreamSource<String> source = env.readTextFile("D:\\0615\\bigdata-flink\\datas\\hello.txt.gz");
        //3. 过滤掉 hello, 单词统计
//        source.filter(_)
        //4. 打印输出
        source.print();
        //5. 执行流环境
        env.execute();
    }
}
